Technology Innovation Institute
Sneha Sivanand, sneha.sivanand@tii.ae
O Instituto de Inovações Tecnológicas (Technology Innovation Institute, TII), centro de pesquisas global e pilar de pesquisas aplicadas do Conselho de Pesquisas Tecnológicas Avançadas (Advanced Technology Research Council, ATRC) de Abu Dhabi, anunciou hoje o lançamento do NOOR, o maior modelo de processamento de linguagem natural (natural language processing, NLP) no idioma árabe já criado no mundo.
A equipe de pesquisa avançada e especialistas em inteligência artificial (IA) do TII uniram forças com a LightOn — empresa de tecnologia que destrava o potencial da inteligência de máquina em escala extrema para empresas — para transformar o modelo de NLP em árabe. O modelo NOOR tem a capacidade de realizar tarefas que vão além do domínio da linguagem, oferecendo dados de alta qualidade em fluxo completo, incluindo rastreamento, filtragem e curadoria em escala. O modelo possibilita treinamento e prestação de serviços distribuídos em escala extrema para fornecer aplicações com inferência eficiente e especialização de modelos.
O Dr. Ray O. Johnson, diretor executivo do TII e da ASPIRE, declarou: “Com este desenvolvimento, estamos no rumo certo para melhorar nossas capacidades e credenciais em pesquisa, além de elevar o status de Abu Dhabi e dos Emirados Árabes Unidos (EAU) como um importante ecossistema de pesquisa. Nossas equipes de especialistas demonstraram uma vez mais que esta região pode obter resultados revolucionários em pesquisa e desenvolvimento para beneficiar o mundo”.
A Dra. Ebtesam Almazrouei, diretora da Unidade Intercentro de Inteligência Artificial do TII, afirmou: “Modelos de linguagem grandes têm revolucionado o mundo do processamento da linguagem natural, e estamos orgulhosos de apresentar este modelo de ponta, com 10 bilhões de parâmetros, o maior modelo de NLP em árabe. O conjunto de dados em árabe coletado para treinar o modelo, com tamanho sem paralelo, é o resultado de meses de dedicação, incluindo curadoria, descarte e filtragem de dados provenientes de diversas fontes. Agradeço especialmente à toda a equipe que trabalhou no projeto para tornar o NOOR o modelo preferencial de exploração em árabe para acadêmicos e empresa em toda parte”.
O Prof. Mérouane Debbah, pesquisador chefe do Centro de Pesquisa em Ciência Digital e da Unidade Intercentro de Inteligência Artificial do TII, comentou no lançamento: “Com o NOOR, o TII ampliou o escopo do modelo do árabe padrão moderno ao empregar amplos conhecimentos em modelos de linguagem natural para desenvolver especialidade interdisciplinar de vanguarda nessa nova geração de pesquisa em IA”.
Para selecionar os maiores conjuntos de dados de alta qualidade em árabe, de diferentes domínios, o conjunto de dados únicos do NOOR de mais de 30 bilhões de palavras combina dados da web com livros, poemas, notícias e informações técnicas para ampliar consideravelmente a aplicabilidade do modelo.
A Dra. Ebtesam Almazrouei afirmou que o modelo NOOR se fundamenta na popular arquitetura Transformer. Como um modelo somente decodificador, com estrutura semelhante à do GPT-3, ele é programado para lidar com tarefas generativas com arquitetura atualizada para refletir os mais recentes desenvolvimentos no mundo do aprendizado de máquina, incluindo aprimoramentos como melhores incorporações posicionais. Para garantir qualidade em grande escala no conjunto de dados do NOOR, a equipe do TII projetou recursos de filtragem fundamentados em técnicas de aprendizado de máquina. Essas ferramentas identificam textos como referências de qualidade e protegem o modelo da exposição ao conteúdo de spam.
Dando aproveitamento máximo ao paralelismo 3D de última geração, o NOOR foi treinado em um recurso de computação de alto desempenho com 128 GPUs A100, possibilitando a distribuição de cálculos e garantindo o uso eficiente dos recursos de hardware disponíveis.
A diretora da Unidade Intercentro de Inteligência Artificial comentou que esse foi apenas o primeiro passo dos esforços da unidade para contribuir com a estratégia de inteligência artificial mais ampla dos EAU.
O modelo leva o nome da palavra “luz” em árabe para estabelecer uma correlação do modelo da língua árabe para iluminar a mente.
Sobre Technology Innovation Institute (TII)
Para mais informações, acesse www.tii.ae.
O texto no idioma original deste anúncio é a versão oficial autorizada. As traduções são fornecidas apenas como uma facilidade e devem se referir ao texto no idioma original, que é a única versão do texto que tem efeito legal.
Technology Innovation Institute
Sneha Sivanand, sneha.sivanand@tii.ae